智能论文笔记

Unsupervised domain adaptation for clinician pose estimation and instance segmentationin the operating room

Vinkle Srivastav , Afshin Gangi , Nicolas Padoy

分类：计算机视觉

2021-08-26

临床医生在手术室（OR）的细粒度定位是设计新一代或支持系统的关键组成部分。需要基于人像素的分段和身体视觉计算机的计算机视觉模型检测，以更好地了解OR的临床活动和空间布局。这是具有挑战性的，这不仅是因为或图像与传统视觉数据集有很大不同，还因为在隐私问题上很难收集和生成数据和注释。为了解决这些问题，我们首先研究了如何在低分辨率图像上进行姿势估计和实例分割，而下采样因子从1x到12倍进行下采样因子。其次，为了解决域的偏移和缺乏注释，我们提出了一种新型的无监督域适应方法，称为适配器，以使模型从野外标记的源域中适应统计上不同的未标记目标域。我们建议在未标记的目标域图像的不同增强上利用明确的几何约束，以生成准确的伪标签，并使用这些伪标签在自我训练框架中对高分辨率和低分辨率或图像进行训练。此外，我们提出了分离的特征归一化，以处理统计上不同的源和目标域数据。对两个或数据集MVOR+和TUM-或TUM-或测试的详细消融研究的广泛实验结果表明，我们方法对强构建的基线的有效性，尤其是在低分辨率的隐私性或图像上。最后，我们在大规模可可数据集上显示了我们作为半监督学习方法（SSL）方法的普遍性，在这里，我们获得了可比较的结果，而对经过100％标记的监督培训的模型的标签监督只有1％。。

translated by 谷歌翻译

SumREN: Summarizing Reported Speech about Events in News

Revanth Gangi Reddy , Heba Elfardy , Hou Pong Chan , Kevin Small , Heng Ji

分类：自然语言处理

2022-12-02

A primary objective of news articles is to establish the factual record for an event, frequently achieved by conveying both the details of the specified event (i.e., the 5 Ws; Who, What, Where, When and Why regarding the event) and how people reacted to it (i.e., reported statements). However, existing work on news summarization almost exclusively focuses on the event details. In this work, we propose the novel task of summarizing the reactions of different speakers, as expressed by their reported statements, to a given event. To this end, we create a new multi-document summarization benchmark, SUMREN, comprising 745 summaries of reported statements from various public figures obtained from 633 news articles discussing 132 events. We propose an automatic silver training data generation approach for our task, which helps smaller models like BART achieve GPT-3 level performance on this task. Finally, we introduce a pipeline-based framework for summarizing reported speech, which we empirically show to generate summaries that are more abstractive and factual than baseline query-focused summarization approaches.

translated by 谷歌翻译

GAUDI: A Neural Architect for Immersive 3D Scene Generation

Miguel Angel Bautista , Pengsheng Guo , Samira Abnar , Walter Talbott , Alexander Toshev , Zhuoyuan Chen , Laurent Dinh , Shuangfei Zhai , Hanlin Goh , Daniel Ulbricht

分类：计算机视觉 | 机器学习

2022-07-27

我们介绍了Gaudi，Gaudi是一种生成模型，能够捕获可以从移动的相机中沉浸式的复杂和现实3D场景的分布。我们通过一种可扩展而强大的方法解决了这个具有挑战性的问题，我们首先优化了散布辐射场和相机姿势的潜在表示。然后，该潜在表示将学习一个生成模型，该模型可以使3D场景的无条件生成和条件生成。我们的模型概括了以前的作品，该作品通过删除可以在样本中共享相机姿势分布的假设来关注单个对象。我们表明，高迪（Gaudi）在多个数据集的无条件生成设置中获得了最先进的性能，并允许有条件地生成3D场景给定的调理变量，例如稀疏图像观测值或描述场景的文本。

translated by 谷歌翻译

Contextual Decision Trees

Tommaso Aldinucci , Enrico Civitelli , Leonardo di Gangi , Alessandro Sestini

分类： (统计)机器学习 | 机器学习

2022-07-13

为了关注随机森林，我们提出了一个多武器的上下文匪徒推荐框架，用于基于特征的学习合奏的单个浅树的选择。在随机森林之上起作用的训练有素的系统动态识别了负责提供最终输出的基本预测因子。这样，我们通过观察推荐树的规则来获得本地解释。进行的实验表明，我们的动态方法优于独立的卡车决策树，并且在预测性能方面与整个黑盒随机森林相当。

translated by 谷歌翻译

Automatic Autism Spectrum Disorder Detection Using Artificial Intelligence Methods with MRI Neuroimaging: A Review

Parisa Moridian , Navid Ghassemi , Mahboobeh Jafari , Salam Salloum-Asfar , Delaram Sadeghi , Marjane Khodatars , Afshin Shoeibi , Abbas Khosravi , Sai Ho Ling , Abdulhamit Subasi

分类：机器学习

2022-06-20

自闭症谱系障碍（ASD）是一种脑部疾病，其特征是幼儿时期出现的各种体征和症状。 ASD还与受影响个体的沟通缺陷和重复行为有关。已经开发了各种ASD检测方法，包括神经影像学和心理测试。在这些方法中，磁共振成像（MRI）成像方式对医生至关重要。临床医生依靠MRI方式准确诊断ASD。 MRI模态是非侵入性方法，包括功能（fMRI）和结构（SMRI）神经影像学方法。但是，用fMRI和SMRI诊断为专家的ASD的过程通常很费力且耗时。因此，已经开发了基于人工智能（AI）的几种计算机辅助设计系统（CAD）来协助专家医生。传统的机器学习（ML）和深度学习（DL）是用于诊断ASD的最受欢迎的AI方案。这项研究旨在使用AI审查对ASD的自动检测。我们回顾了使用ML技术开发的几个CAD，以使用MRI模式自动诊断ASD。在使用DL技术来开发ASD的自动诊断模型方面的工作非常有限。附录中提供了使用DL开发的研究摘要。然后，详细描述了使用MRI和AI技术在自动诊断ASD的自动诊断期间遇到的挑战。此外，讨论了使用ML和DL自动诊断ASD的研究的图形比较。最后，我们提出了使用AI技术和MRI神经影像学检测ASD的未来方法。

translated by 谷歌翻译

BED: A Real-Time Object Detection System for Edge Devices

Guanchu Wang , Zaid Pervaiz Bhat , Zhimeng Jiang , Yi-Wei Chen , Daochen Zha , Alfredo Costilla Reyes , Afshin Niktash , Gorkem Ulkar , Erman Okman , Xia Hu

分类：计算机视觉 | 人工智能 | 机器学习

2022-02-14

在边缘设备上部署深层神经网络〜（DNNS）为现实世界任务提供了有效的解决方案。边缘设备已用于在不同域中有效地收集大量数据。DNN是用于数据处理和分析的有效工具。但是，由于计算资源和内存有限，在边缘设备上设计DNN是具有挑战性的。为了应对这一挑战，我们演示了最大78000 DNN加速器上边缘设备的对象检测系统。它分别与摄像头和用于图像采集和检测展览的LCD显示器集成了启动DNN的推断。床是一种简洁，有效且详细的解决方案，包括模型培训，量化，合成和部署。实验结果表明，床可以通过300 kb微小的DNN模型产生准确的检测，该模型仅需91.9 ms的推理时间和1.845 MJ的能量。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biomonitoring, Artificial Intelligence, and Precision Space Health

Ryan T. Scott , Erik L. Antonsen , Lauren M. Sanders , Jaden J. A. Hastings , Seung-min Park , Graham Mackintosh , Robert J. Reynolds , Adrienne L. Hoarfrost , Aenor Sawyer , Casey S. Greene

分类：机器学习

2021-12-22

超越地球轨道的人类空间勘探将涉及大量距离和持续时间的任务。为了有效减轻无数空间健康危害，数据和空间健康系统的范式转移是实现地球独立性的，而不是Earth-Reliance所必需的。有希望在生物学和健康的人工智能和机器学习领域的发展可以解决这些需求。我们提出了一个适当的自主和智能精密空间健康系统，可以监控，汇总和评估生物医学状态;分析和预测个性化不良健康结果;适应并响应新累积的数据;并提供对其船员医务人员的个人深度空间机组人员和迭代决策支持的预防性，可操作和及时的见解。在这里，我们介绍了美国国家航空航天局组织的研讨会的建议摘要，以便在太空生物学和健康中未来的人工智能应用。在未来十年，生物监测技术，生物标志科学，航天器硬件，智能软件和简化的数据管理必须成熟，并编织成精确的空间健康系统，以使人类在深空中茁壮成长。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biological Research, Artificial Intelligence, and Self-Driving Labs

Lauren M. Sanders , Jason H. Yang , Ryan T. Scott , Amina Ann Qutub , Hector Garcia Martin , Daniel C. Berrios , Jaden J. A. Hastings , Jon Rask , Graham Mackintosh , Adrienne L. Hoarfrost

分类：机器学习

2021-12-22

空间生物学研究旨在了解太空飞行对生物的根本影响，制定支持深度空间探索的基础知识，最终生物工程航天器和栖息地稳定植物，农作物，微生物，动物和人类的生态系统，为持续的多行星寿命稳定。要提高这些目标，该领域利用了来自星空和地下模拟研究的实验，平台，数据和模型生物。由于研究扩展到低地球轨道之外，实验和平台必须是最大自主，光，敏捷和智能化，以加快知识发现。在这里，我们介绍了由美国国家航空航天局的人工智能，机器学习和建模应用程序组织的研讨会的建议摘要，这些应用程序为这些空间生物学挑战提供了关键解决方案。在未来十年中，将人工智能融入太空生物学领域将深化天空效应的生物学理解，促进预测性建模和分析，支持最大自主和可重复的实验，并有效地管理星载数据和元数据，所有目标使生活能够在深空中茁壮成长。

translated by 谷歌翻译

MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding

Revanth Gangi Reddy , Xilin Rui , Manling Li , Xudong Lin , Haoyang Wen , Jaemin Cho , Lifu Huang , Mohit Bansal , Avirup Sil , Shih-Fu Chang

分类：自然语言处理 | 计算机视觉

2021-12-20

最近，对建立问题的兴趣越来越兴趣，其中跨多种模式（如文本和图像）的原因。但是，使用图像的QA通常仅限于从预定义的选项集中挑选答案。此外，在现实世界中的图像，特别是在新闻中，具有与文本共同参考的对象，其中来自两个模态的互补信息。在本文中，我们提出了一种新的QA评估基准，并在新闻文章中提出了1,384个问题，这些文章需要跨媒体接地图像中的物体接地到文本上。具体地，该任务涉及需要推理图像标题对的多跳问题，以识别接地的视觉对象，然后从新闻正文文本中预测跨度以回答问题。此外，我们介绍了一种新颖的多媒体数据增强框架，基于跨媒体知识提取和合成问题答案生成，自动增强可以为此任务提供弱监管的数据。我们在我们的基准测试中评估了基于管道和基于端到端的预先预测的多媒体QA模型，并表明他们实现了有希望的性能，而在人类性能之后大幅滞后，因此留下了未来工作的大型空间，以便在这一具有挑战性的新任务上的工作。

translated by 谷歌翻译

NewsClaims: A New Benchmark for Claim Detection from News with Background Knowledge

Revanth Gangi Reddy , Sai Chinthakindi , Zhenhailong Wang , Yi R. Fung , Kathryn S. Conger , Ahmed S. Elsayed , Martha Palmer , Heng Ji

分类：自然语言处理 | 人工智能

2021-12-16

索赔检测和验证对于新闻认识至关重要，并且已成为有前途的技术，以减轻新闻中的错误信息。然而，大多数现有的工作侧重于索赔句子的分析，同时俯瞰关键背景属性，例如索引者，声称对象和连接到索赔的其他知识。在这项工作中，我们提供了新闻本，新的基准，了解新闻领域的知识意识索赔检测。我们重新定义了索赔探测问题，包括提取与索赔相关的附加背景属性，并发布529索赔由103个新闻文章提示。此外，报讯人旨在在新兴场景中索取索赔检测系统，包括不少培训数据的看不见的主题。最后，我们对这款新基准测试提供了对各种零射和及时的基础基准的全面评估。

translated by 谷歌翻译